语音合成相关论文
近年来,深度学习先进技术层出不穷促进着语音合成技术快速发展,机器发出的声音越来越接近真人的声音。然而,相比于汉语、英语等通......
人工智能技术的发展与应用为有声书出版注入新的活力,也为有声书著作权保护带来一定挑战,除有声书出版中常见的作品侵权、授权侵权、......
AI智能语音技术在教育教学中的应用重点是线上教学,针对目前线上教学采用语音录播方式,存在建设效率低、语音准确性低、录播时间长、......
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成......
语音合成是人机交互的组成部分,并在该过程中起到了闭环的作用。人在说话时能表现出自己的情绪状态,如高兴、悲伤、愤怒等,在现有的语......
针对现有盲文书籍少且价格昂贵,而常人阅读的纸质书籍多,但缺乏盲人阅读设备的问题,设计了基于安卓(Android)的盲用手机阅读器。该阅读......
随着人工智能技术的飞速发展,大数据背景下的深度学习得到了长足的发展,其具备对海量数据建模的超强能力,被广泛应用于图像、语音识别......
端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音......
近年来随着移动智能设备的兴起,人们越来越频繁的接触和使用语音信息,语音伪造和鉴伪成为语音处理领域中愈加重要的技术.本文首先......
人工智能技术发展至今,人机交互方式几经迭代,从最早的键盘鼠标方式到后来的触屏手写再到现如今的智能语音交互方式,对人们使用智......
在机器人语音交互系统中存在共性问题,包括环境噪声、位置距离等,这些因素的共同影响下导致机器人语音交互效果较差,因此,有必要设计一......
语音合成作为如何将机器智能化的关键研究领域,旨在解决如何让机器发声的问题。随着社会智能化程度越来越高,智能语音设备已经融入......
针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:......
随着计算机技术的飞速发展,语音合成(Text-to-Speech,TTS)已经成为人机交互中不可或缺的一部分,并且在人机交互中扮演着重要角色。而......
近年来,随着计算机科学和人工智能技术的不断发展,语音合成技术已经被广泛应用在文本阅读、智能导航等领域,机器输出的语音已经慢......
语音是人们日常生活中获取信息的重要途径,使用机器模拟人类发声输出语音信息在智能设备等诸多领域有着广泛应用。在语音合成领域......
电网调度工作是保证电网中设备能够安全、高效运行的有效手段,需要设计并开发出一套符合电网智能化管理需求的,能够提高调度人员和......
针对基于RNN的神经网络语音合成模型训练和预测效率低下以及长距离信息丢失的问题,提出了一种基于BERT的端到端语音合成方法,在语......
作为人机语音交互的出口,语音合成的效果直接影响到人机交互的体验。一个高质量的、稳定的语音合成系统能够让机器更加地拟人化,使......
由于政治经济发展、医疗水平提升以及计划生育等政策,中国社会已经自2000年开始正式进入人口老龄化阶段。2019年11月22日附近,中共......
由于用电户数在不断地增加,电力工作人员的电费催费与回收的工作也日趋繁重,而传统的催费方式存在很大的局限性.因此,实现电费催费......
能够模拟真实工作场景的高铁牵引供电调度仿真平台对供电调度人员的培训工作具有重要的意义。牵引供电调度人员的日常主要工作内容......
语音合成技术在读书播报、语音导航和智能音响等很多领域发挥着重要的作用。目前,基于循环神经网络构建的端到端语音合成系统已经......
语音承载着人类语言和说话人身份信息,通过语音伪造技术可以精确模仿目标说话人的声音以达到欺骗人或机器听觉的目的.目前,深度伪......
语音合成(speech synthesis,又名text-to-speech,TTS)是人机交互的重要方法之一,旨在合成清晰且自然的音频。语音合成的应用场景非常......
在现今信息科学技术高速发展的时代,智能化设备层出不穷,计算机、智能手机等通讯设备不断更新,公共社交APP增加,人们开始注意自己......
为了提高语音合成自然度和稳定性,提出HMM与深度神经网络相融合的,以维吾尔语作为实验语言的语音合成方法.基于深度学习的端到端语......
为了做好疫情防疫工作,满足每人每日防疫填报提醒及人体温度非接触快速测量需要,设计了一种定时语音提醒及人体温度快速测量装置.......
智能语音客服是如今机器学习和人工智能算法研究的重点,对于企业来说是节省人力回答高频重复性问题的必须,对于个人来说也希望有拟......
文中首先对Microsoft Agent技术进了介绍,分析了MicrosoftAgent提供的人机交互功能及其特点,探讨了Microsoft Agent角色动画、语音......
本文对改进的LSP参数格型矢量量化方法进行了介绍。格型矢量量化(LVQ)是矢量量化方法的一个新分支,较传统方法有存储量和计算量低......
本文提出了一种基于Sinusoidal+全极点模型的语音频谱平滑方法,该方法先对待平滑语音段的LPC参数进行插值,然后以这些插值得到的LP......
人机交互中最自然、最理想的交流方式为语音,其中主要涉及到了语音合成,即文本转换为语音的技术.随着神经网络理论的不断深入,基于......
脑卒中后患者会出现不同的并发症,其中约37.66%都存在语言障碍.语言障碍使得他们无法与外界进行交流沟通,对他们的治疗和生活都造成......
本文提出了一种基于声学模型Viterbi解码的中文合成音库韵律短语边界自动标注方法,以降低大语料库单元 拼接合成系统的构建成本。该......
研究表明,基于隐马尔可夫模型的语音合成(HMM-based speech synthesis)中结合整体方差(Global variance, GV)模型的参数生成方法对......
传统基于线性预测(LP)声码器采用简单的脉冲加白噪声激励模型,合成语音有严重的机器声。为了提高传统线 性预测声码器的合成音质,本......
本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中,发音特征(......
本文对基于隐马尔柯夫模型(Hidden Markov Model, HMM)的单元挑选语音合成方法进行改进。针对原有方法单元预选过程中存在的线性搜索......
将篇章层面的文本转换为准确、生动的合成语音,涉及了语言计算、韵律建模、语音合成等一系列技术问题。而这些问题的解决,一方面需要......
语音技术主要是指基于语音进行处理的技术,主要包括语音识别、语音合成、语音压缩等.其中最富有挑战性和最富有应用前景的为语音识......